بررسی مقایسه‌ای تأثیر برچسب‌زنی مقولات دستوری بر تجزیه در پردازش خودکار زبان فارسی

نویسنده

  • قیومی, مسعود پژوهشکده زبانشناسی، پژوهشگاه علوم انسانی و مطالعات فرهنگی، تهران، ایران
چکیده مقاله:

In this paper, the role of Part-of-Speech (POS) tagging for parsing in automatic processing of the Persian language is studied. To this end, the impact of the quality of POS tagging as well as the impact of the quantity of information available in the POS tags on parsing are studied. To reach the goals, three parsing scenarios are proposed and compared. In the first scenario, the parser assigns the POS tags firstly and then it parses the input sentence. In the second scenario, an external POS tagger is usedto assign the tags, then the sentence is parsed. In the third scenario, the parser uses the gold standard POS tags to parse the input sentence. In this study, various evaluation metrics are used to show the impacts from different points of views. The experimental results show that the quality of the POS tagger and the quantity of the information available in the POS tags have a direct effect on the parsing performance. The high quality of the POS tags causes error reduction in parsing and also it increases parsing performance. Moreover, lack ofmorphological -syntactic information in the POS tags has a high negative impact on parsing performance. This impact is more pronounced than the impact of POS tagger performance. 

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

ضرورت توجه به مقولات لغوی و دستوری متفاوت در زبان روسی و فارسی و چگونگی تطبیق آن ها

می توان با اطمینان گفت، که مشکل ترین مقولة لغوی و دستوری در زبان روسی، مقولة افعال این زبان است. فعل در هر زبانی هستهء مرکزی صرف را تشکیل می دهد و در زبان روسی به لحاظ وجود برخی مکانیسم های دیگر که از مهم ترین آن ها نگرش گوینده به نحوهء چگونگی آن است، با زبان فارسی تفاوت دارد. همچنین مقوله مطلق و استمراری افعال در زبان روسی به لحاظ ایجاد تغییرات معنایی از ظرافت خاصی برخودار است. به همین علت مجر...

متن کامل

تأثیر ساخت‌واژه‌ها در تجزیه وابستگی زبان فارسی

Data-driven systems can be adapted to different languages and domains easily. Using this trend in dependency parsing was lead to introduce data-driven approaches. Existence of appreciate corpora that contain sentences and theirs associated dependency trees are the only pre-requirement in data-driven approaches. Despite obtaining high accurate results for dependency parsing task in English langu...

متن کامل

بررسی مفاهیم وجهی زمان دستوری در زبان فارسی

استفاده از زمان دستوری برای بیان مفاهیم وجهی، یا به عبارتی شیوه‌های استفاده از زمان دستوری به عنوان ابزار اعمال نظر گوینده در مورد محتوای گزاره در زبان فارسی، موضوعی است که در مقالة حاضر مورد بررسی قرار می‌گیرد. نتایج این بررسی نشان می‌دهد که ساختارهای زمانی در زبان فارسی چه در زمان گذشته و چه غیر‌گذشته در قالب‌های مختلفی از جمله شرطی، انعکاس اشاره ای و ساختار تمنایی و التزامی به طور فعال در ان...

متن کامل

تأثیر راهبرد ترجمه بر خطاهای دستوری و واژگانیِ فارسی‌آموزان چینی در نگارش به زبان فارسی

از آن‏جا که مهم‌ترین و کاربردی‌ترین مرحله در فرایند بررسی و واکاوی خطاهای زبانی یادگیرندگان زبان دوم/خارجی، یافتن راهکارهایی برای کاهش این نوع خطاها می‌باشد، پژوهش حاضر به بررسی تأثیر به‌کارگیری «راهبرد ترجمه» بر کاهش میزان خطاهای دستوری و واژگانی فارسی‌آموزان چینی پرداخته است. به همین منظور، از 12 فارسی‌آموز چینی پیشرفته خواسته شد که در دو مرحله، به نگارش یک متن به زبان فارسی بپردازند. در مرحل...

متن کامل

مروری بر دشواریهای زبان فارسی در محیط دیجیتال و تاثیرات آنها بر اثر بخشی پردازش خودکار متن و بازیابی اطلاعات

هدفهای پژوهش: زبان فارسی، به سبب ویژگیهای خاصّ آن و در عین حال نهادینه نشدن سبک نگارش استاندارد، در رویارویی با محیطهای الکترونیکی، با دشواریهایی روبه‎روست که تأثیری بسزا بر اثربخشی بازیابی اطلاعات می‎گذارد. پژوهش حاضر می‎کوشد تا با بررسی متون و پیشینه‎های موجود، چالشهای نگارش فارسی، تأثیر آنها بر اثربخشی بازیابی اطلاعات، و پیشنهاد‎های ارائه شده در جهت رفع این دشواریها را مورد بحث و بررسی قرار د...

متن کامل

بررسی تباین کلی اصطلاحات دستوری در زبان فارسی و آلمانی در آموزش زبان آلمانی

بی‌ گمان ، اصطلاحات دستوری به‌ تنهایی کمک چندانی در آموختن زبان بیگانه نمی‌ کنند، اما باید توجه داشت که چنانچه دستور زبانی ، به هر دلیل، به زبان فارسی نوشته ‌شود ، باید تفاوت‌ های میان اصطلاحات دستوری این دو زبان نیز در نظر گرفته شوند تا خوانندگان دچار لغزش نشوند . بیشتر نویسندگان دستور آلمانی در ایران ، آلمانی ‌دانهای ایرانی ‌اند که گاهی در برگردان اصطلاحات دستوری دچار خطا شده‌اند ، امری که می...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 13  شماره 4

صفحات  121- 132

تاریخ انتشار 2017-03

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

کلمات کلیدی

کلمات کلیدی برای این مقاله ارائه نشده است

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023